ChatGPT背后:一个天才、百亿融资和1亿日活|全球独角兽
为什么不是Google, DeepMind or someone else? |
本文,36氪试图回答一些问题:ChatGPT何以免去AI对话固有的道德、法律非议?为什么OpenAI能够成为破局者?手握海量数据和大量计算资源的科技巨头如谷歌、Meta败阵而归,AIGC赛道创业公司不胜枚举,OpenAI为何能够拔得头筹?微软持续多次豪掷百亿,野心到底是什么?
钱和所有AI技术的关系都是必要不充分的:钱不一定能砸出AI突破性进展,但是没钱一定做不出来。
这条对OpenAI一样适用。对AI研发企业而言,无论是NLP模型的开发和训练,以及后续AI服务提供所需担负的算力成本和运营成本,还是需要向顶尖科研人员支付高昂的薪酬。
AI实现路径条条不同,OpenAI又选择了一条更烧钱的技术路径——通过增加数据量、提高算力来提升模型性能。仅2022年,OpenAI就花费了约5.44亿美元,而收入仅为3600 万美元。
这样的“账”显然不是一般创业公司所负担得了。但好在,从创立那天开始,OpenAI就不缺钱。
2015年OpenAI 成立之初,与创始团队背景同样瞩目的是众星云集的投资者名单和高达10亿美元的启动资金,这其中包括Elon Musk 、Peter Thiel 和PayPal校友、LinkedIn联合创始人Reid Hoffman 等多位硅谷重量级人物的资金支持。2016年,Y Combinator又追加了12万美元的种子前轮投资。
相比之下,Google 2014年收购DeepMind仅花费了4亿美元。
OpenAI 管理层并不满足于此。为满足呈指数级增长的计算资源需求,这些资金或许远远不够:以GPT-3为例,2020年,大型语言模型GPT-3的发布使OpenAI在AIGC领域初露头角。聊天机器人ChatGPT正是在此模型基础上构建的。相较于2019年2月发布的GPT-2,GPT-3的模型能力得到了显著提升,易用性、安全性有了明显改进,在文案写作和总结、翻译、对话等任务中的表现都更加优异。也正因此,GPT-3成为了OpenAI首个开放商用测试的语言模型。GPT-3和GPT-2的最大区别在于模型规模更大——GPT-2拥有15亿参数,GPT-3则拥有1750亿参数,模型训练使用的数据量高达0.4万亿token。然而,和模型规模、训练数据量一样增长的,是GPT-3的模型训练成本。有数据显示,GPT-3的单次训练成本高达460万美元。
OpenAI疯狂码算力的烧钱速度的确超乎想象。根据2020年发表于MIT Technology Review上的一篇针对OpenAI的采访报道,OpenAI联合创始人Greg Brockman称,公司早在2017年就意识到保持非营利组织在财务上是不可持续的。
为满足日益增长的资金需求,2019年3月,成立四年后的OpenAI 设立OpenAI LP,从非盈利公司转型为有限盈利公司,并紧接着在7月宣布了微软的10亿美元注资。此外,OpenAI 同年还获得了来自Khosla Ventures、Reid Hoffman Foundation、Matthew Brown Companies的投资。
在2023年微软确认追加数十亿美元投资前,OpenAI 已完成六次融资。GPT-3、DALL·E 2图像生成器、ChatGPT这三个关键产出正是在OpenAI完成组织变革和一系列吸金动作后陆续推出的。
看到这里,或许有人会疑惑,既然AI烧钱人尽皆知,为什么连谷歌收购DeepMind都只花了4亿,而OpenAI却能以“十亿”为单位不停拿钱?
种种夸张吸金动作背后,答案指向一个天才——Sam Altman。
2019年3月,Sam Altman接管OpenAI LP,改变了OpenAI的融资策略,进一步给了OpenAI烧钱的底气。Sam Altman的独特经历赋予了他敏锐的商业嗅觉和出色的融资能力,使其成为了接管OpenAI LP的不二人选。
尽管Sam Altman也是技术出身,但他并不单纯关注技术进步,而是在注重效率和产出的同时,更加看中能够通过技术进步实现的价值创造。
Altman的天才属性自小就有体现。从8岁起就开始学习编程,在预科毕业进入斯坦福大学学习计算机科学两年后,Altman和同学辍学创办了Loopt——一款用于共享实时位置的应用程序。然而,影响其后续职业走向的并非Loopt本身,而是作为Loopt投资方之一的Y Combinator。
依靠从Loopt挖到的第一桶金,Altman转而投身于风投事业,于2012年创办了Hydrazine Capital,将筹得的大部分资金投向了Y Combinator投资的公司。
2014年,年仅28岁的Altman接任Paul Graham的Y Combinator总裁一职,并于次年登榜《福布斯》30岁以下风险投资人TOP 30榜单。在任期间,Altman致力于为理工科创业公司提供机遇,关注能够在实现技术突破后获得巨大潜在回报的深科技领域,包括核聚变、量子计算。
据他所说,通用人工智能,也是其中之一。Sam Altman认为,AI将引领新一代技术革命,而通用人工智能是需要让所有人都能享受到技术革命带来的红利。在2022年9月Greymatter的一集播客中, Greylock合伙人、领英创始人Reid Hoffman与Altman围绕下一代AI技术展开了探讨。Altman称“AI是一个可以孵化出无数工具,推动各行各业前进的基础平台。”
也就是说,Altman认为在底层人工智能技术的加持下,将会产生更多的,基于特定行业的具体应用场景,帮助行业实现技术变革。这也意味着,最后可以获得最大收益的是能够率先搭建技术领先的基础AI模型,并先发制人,以开放API的形式,吸引各行业企业基于基础模型开发具体AI应用的企业。
凭借自身对AI行业的独特理解,以及从业多年对科技创投圈兴奋点的把控,Sam Altman显然向硅谷完美讲述了他所认为的OpenAI的高估值故事,并在组织变革的关键时点成功将微软拉入局中,为这一估值故事背书。
事实上,在Sam Altman成为OpenAI LP掌舵人后,OpenAI 的发展策略——先发制人以获取先动优势,也正是参照Altman对行业未来的设想进行的。
一方面,正如Sam Altman所说,OpenAI的战略选择是“先做最有信心能成功的事情,然后分出10%的资源进行成功确定性更低的探索工作”。通过迅速推出市场可感知的AI技术进步,并展现出商业化前景的产品:AI图像生成工具DALL·E 2、AI聊天机器人ChatGPT,OpenAI在声量上已经秒杀一众科技巨头。在DALL·E 2正式开放注册后,用户数高达 150 多万,这一数字在一个月后翻了一倍。而ChatGPT的月活用户数更是在上线后两个月就突破了一亿。ChatGPT的病毒式增长也为OpenAI提供了有助于模型优化的大量用户数据。
另一方面,尽管围绕OpenAI是否仍然“Open”的争论仍未停息,但是早在推出GPT-3的时候,OpenAI就开启了小规模的商业测试,并逐步开放API接口。据路透社报道,迄今为止,已有多家企业,甚至竞争对手在OpenAI上构建应用程序,其中一些企业已借此实现了用户数量和营业收入的增长。文案生成平台Jasper就是其中之一。根据TechCrunch报道,据Jasper CEO Dave Rogenmoser 称,截至2022年10月,Jasper用户数量已超7万,在推出后一年内就创造了约4500万美元的收入,并预计将会在2022 年底实现收入翻番。
1月,微软确认三度投资OpenAI,金额数十亿美元;2月8日,微软整合ChatGPT产品至其搜索引擎产品Bing当中。
不少人认为,现在微软已经成为ChatGPT背后的最大赢家:
从投资角度,在收回投资之前,微软将获得OpenAI 75%的利润分成,之后微软将持有OpenAI 49%的股份,OpenAI一旦开始盈利,在返还First close partners(FCP)后,75%的盈利将回报给微软;
从商业竞争角度,此前多年谷歌一直占有全球90%搜索引擎的份额,而微软此次和Bing联动,或将改变互联网商业格局。
而当我们把视线收回到2019年,微软第一次给OpenAI 10亿美元时,或许并没有想到自己将成为最大赢家。
微软和OpenAI的前世今生起源已久。迄今为止,微软已经完成了分别于2019年、2021年对OpenAI承诺的两笔投资。今年1月宣布的第三笔数十亿美元投资意味着微软和OpenAI的进一步深度绑定。
如今看来,资金投入仅是微软和OpenAI合作的第一层;微软押注OpenAI也绝非谋求未来利润回报这么简单。
一方面,OpenAI亟需算力投入和商业化背书。为拉动微软入局,Sam Altman做了不少努力。在接管OpenAI LP后,Altman多次飞往西雅图与微软CEO Satya Nadella进行交谈。
另一方面,微软2016年推出Tay聊天机器人受挫后,在AI技术商业化应用方面日渐式微,在基础研究层面也尚无具备广泛影响力的产出,亟需寻求技术突破,以重获AI竞争力。
2019年微软首次注资OpenAI后,双方开始在微软的Azure云计算服务上合作开发人工智能超级计算技术。同时,OpenAI逐渐将云计算服务从谷歌云迁移到Azure。有报道指出,OpenAI每年在微软云服务上模型训练花费约为7000万美元,构成了微软向OpenAI投资的重要部分。
有了微软云的加持,OpenAI码算力的能力和底气日渐增长,第一个突破性成果GPT-3随之于2020年问世。同年,微软买断了GPT-3基础技术的独家许可,并获得了技术集成的优先授权,将GPT-3用于Office、搜索引擎Bing和设计应用程序Microsoft design等产品中,以优化现有工具,改进产品功能。
2021年微软再次投资,双方合作关系正式进入第二阶段,从合作探索期进入蜜月期。一方面,作为OpenAI的独家云提供商,在Azure中集中部署OpenAI开发的GPT、DALLE、Codex等各类工具。这也形成了OpenAI最早的收入来源——通过Azure向企业提供付费API和AI工具。
与此同时,拥有OpenAI新技术商业化授权,微软开始将OpenAI工具与自有产品进行深度集成,并推出相应产品。例如,2021年6月基于Codex,微软联合OpenAI、GitHub 推出了AI代码补全工具GitHub Copilot。该产品于次年6月正式上线,以月付费10 美元或年付费100美元的形式提供服务。
2022年,微软开始通过Edge浏览器和Bing搜索引擎在部分国家和地区提供基于AI图像生成工具DALLE开发的Image creator新功能。同年10月,微软宣布将推出视觉设计工具Microsoft designer。
而今年公布的微软对OpenAI的第三次出手,彻底拉开了AI军备竞赛的帷幕,也标志着OpenAI新技术商业化进入了新的阶段。
从现有结果来看,通过指数级增长的计算资源投入,来实现技术持续改进,以量变推动质变,这一以快制胜的路径是OpenAI在这一阶段作出的正确选择。
对微软而言,不管OpenAI未来是否会在达成承诺的投资回报后拿回经营主动权,至少目前看来,微软已经靠“借力打力”在AI领域扳回一城。
Google与OpenAI大型语言模型研发大事记
根据微软和Google争先召开发布会这一行为来看,我们或许将很快得到这些问题的答案。
1月,OpenAI开始围绕付费版本ChatGPT Professional开展市场测试,并于2月1日正式推出ChatGPT Plus,定价为月订阅费20美元。付费用户可以获得更快的响应速度,并优先尝试新功能。目前该服务仅限于美国本地用户使用,预计后续将面向其他国家和地区提供。 微软也于2月1日发布了基于ChatGPT的高端版Teams消息服务,用以简化会议,包括自动生成会议记录、推荐任务,创建会议模版等。每月费用为10美元。 2月4日,ChatGPT版搜索引擎悄然上线,但几分钟又后迅速下线。而就在今日凌晨(当地时间2月7日下午),微软在紧急召开的记者会上宣布和ChatGPT具有类似功能的新版Bing引擎将于当日上线。